メインコンテンツまでスキップ

🔒 2-5 生成AIの知識制限

🕒 生成AIの知識の限界:カットオフデイト

生成AIに質問する方法がわかったところで、生成AIがどこまで回答できるのか、気になりませんか?

生成AIの各モデルには「カットオフデイト」と呼ばれる日付の概念があり、その時点までで得られた情報に基づく学習が行われています。つまり、生成AIのモデルがそもそもカットオフデイト以降の出来事や情報について知らないので回答できないということです。ただ、カットオフデイト以前の内容でも回答として生成されない場合もあります。

🚧 理由

訓練データに含まれていない情報

カットオフデイト以前の内容でも、すべての情報が訓練データに含まれているわけではありません。訓練データは膨大ですが、情報源の制約や内容の選別によって一部の情報が含まれていない場合があります。

情報の正確性

生成AIは、情報を完全に理解しているわけではなく、統計的なパターンに基づいて回答を生成しています。そのため、必ずしも正確な情報を提供できるとは限りません。特に専門知識や最新情報が必要な場合は注意が必要です。

例えば、Claude 3.5 SonnetはLLMモデルの中でもカットオフデイトが2024年4月と直近のウェブの知識まで保有しています。

OpenAI社のサム・アルトマンが2023年11月、突如解任されたニュースはAI業界に大きな衝撃となりました。 カットオフデイトが2024年4月であるClaude 3.5 Sonnetであれば回答できるはずという期待ができるので聞いてみましょう。

「サム・アルトマンはなぜOpenAIを解任されたの?」

OpenAIアルトマン

回答:OpenAIアルトマン

こちらは正しい回答を出してくれています。

ちなみにChatGPT-4oのカットオフデイトは、2023年10月 https://platform.openai.com/docs/models/gpt-4o ですが、同様の質問をしてみると下記のような回答になります。

回答:OpenAIアルトマン

モデルごとにいつまでの知識を保有しているのかバラツキがあるということを念頭におく。またリアルタイム性を追求することはできない。

次に、例えカットオフデイト以前の情報でも知識として持っていない場合、回答を生成し結果的にハルシネーションになってしまうという例を見てみましょう。

IMF(国際通貨基金)が発表した2024年2月発表したGDPランキングでは日本が3位から4位に下がったことが話題になりました。

繰り返しますが、Claude 3.5 Sonnetは2024年4月がカットオフデートなので、2024年現時点における日本のGDPランキングについて教えて」という質問を投げかけてみましょう。

回答:Claudeカットオフ

2024年度のGDPはすでに公開情報ですが、「申し訳ありませんが、2024年の正確なGDPランキングを提供することはできません。なぜなら、2024年はまだ始まっておらず、将来の経済状況を正確に予測することは困難だからです。」と冒頭の記述から始まります。

こういった形で、カットオフデイト以前の内容でも情報を知らない場合があるということと、生成する特性が故にハルシネーションが発生していないか頭の片隅におきながら生成AIをうまく使いこなすことが大切です。

🔍 (おさらい)ハルシネーションとは?

生成AIは完璧ではありません。時には、事実とは異なる情報を、あたかも真実のように生成してしまうことがあります。これを「ハルシネーション(幻覚)」と呼びます。

  • : 年代や数字の誤り、計算結果の誤り、事実関係の誤りなど。
  • 対応策: 生成AIが出力した情報は、必ず ファクトチェック を行うことが重要です。

🔍 生成AIの真価

ここまで、生成AIに質問や依頼を試してみました。情報探索や文章構成などのタスク実行は業務効率化に貢献できることがなんとなくおわかりいただけたでしょうか。次の章では、法人が生成AIを活用する可能性についてさらに探求していきましょう。